Fonte: Wikipedia - Regressão Linear Simples
Definição:
Em estatística , regressão linear simples é o quadrado mínimo estimador de um modelo de regressão linear com uma única variável explicativa. Em outras palavras, regressão linear simples se encaixa uma linha reta através do conjunto de pontos n de tal forma que faça a soma dos quadrados residuais do modelo ( isto é, as distâncias entre os pontos verticais do conjunto de dados e a linha reta) tão pequena quanto possível.
Para se estimar o valor esperado, usa-se de uma equação, que determina a relação entre ambas as variáveis:
$${\Large Y_i = \alpha + \beta X_i}$$
In [3]:
using Gadfly
using CurveFit
set_default_plot_size(23cm,10cm)
In [4]:
x=rand(100)
y=rand(100) .+ 1.6*(x .+ 20.0);
In [5]:
p=plot(x=x, y=y)
Out[5]:
In [6]:
α = (sum(x .^ 2.0) * sum(y) - sum(x .* y) * sum(x)) / (length(x) * sum(x .^ 2.0) - sum(x)^2)
Out[6]:
In [7]:
β = (length(x)*sum(x .* y) - sum(x) * sum(y)) / (length(x)*sum(x .^ 2.0) - sum(x)^2)
Out[7]:
In [8]:
yy(xx) = α + β*xx
Out[8]:
In [9]:
plot(layer(x=x, y=y, Geom.point), layer(yy, minimum(x), maximum(x), Geom.line, Theme(default_color=colorant"red")))
Out[9]:
In [10]:
α, β = CurveFit.linear_fit(x, y)
Out[10]:
In [11]:
yyy(xx) = α + β*xx
Out[11]:
In [12]:
plot(layer(x=x, y=y, Geom.point), layer(yyy, minimum(x), maximum(x), Geom.line, Theme(default_color=colorant"red")))
Out[12]: